DOI:10.11931/guihaia.gxzw202210078 


白芷 全 基因 组 测序 分 析 及 BGLU 基因 家 族 分 析 
王 雅 兰 ， 周 罗 静 ， 张 灵 迁 ， 章 景 ， 证 金辉， 高 继 海 * 
(成 都 中 医药 大 学 西南 特色 中 药 资源 国家 重点 实验 室 ， 成 都 611137) 

要 : 和 白芷 为 常用 的 药 食 同 源 的 品种 ， 既 是 临床 常用 中 药 ， 也 是 香料 ， 用 途 十 分 广泛 。 为 
取 白 芷 全 基因 组 序列 信息 ， 该 研究 用 杭 白 芷 叶片 DNA 为 材料 ， 采 用 Nanopore 测序 技术 
构建 杭 和 白芷 全 基因 组 数据 库 ， 并 利用 生物 信息 学 方法 对 获得 的 核 音 酸 序列 进行 组 装 、 功 能 
注释 以 及 进化 分 析 研 究 。 结 果 表 明 : (1) 原始 测序 数据 过 滤 后 获得 662 Gb 三 代数 据 ，Read 
N50 约 为 32 932 bp， 经 过 组 装 得 到 杭 和 白芷 基因 组 大 小 为 $5.6 Gb, Contig N50 约 为 806 638 
bp。(2) 组 装 后 的 序列 通过 与 KOG、GO、KEGG 等 功能 数据 库 比 对 ， 得 到 了 功能 注释 的 
基因 共有 66.47%，KOG 功能 注释 结果 表明 杭 白 芷 的 蛋白 功能 主要 集中 在 一 般 功 能 预测 、 
翻译 后 修饰 、 蛋 白质 转换 、 伴 侣 以 及 信号 转 导 机 制 ; GO 功能 分 类 表明 杭 和 白芷 的 基因 集中 
在 生物 学 过 程 及 细胞 组 分 KEGG 通路 注释 表明 参与 代谢 途径 的 基因 占 主要 地 位 。(3) 杭 
白芷 的 
组 
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基因 集中 在 45 个 BGLU 家 族 基 因 。 该 研究 首次 利用 第 三 代 测 序 技术 对 杭 白 芷 全 基因 
进行 解析 ， 为 杭 和 白芷 的 系统 生物 学 研究 芮 定 基 础 ， 有 利于 进一步 深入 开发 和 利用 杭 白 
E， 同 时 也 对 杭 和 白芷 中 BGLU 家 族 基 因 进 行 初步 分 析 ， 为 后 续 进 一 步 研 究 BGLU 在 杭 白 芷 
长 发 育 中 的 功能 提供 了 重要 的 理论 基础 。 
关键 词 : 杭 白 芷 ， 基 因 组 ， 第 三 代 测 序 技术 ，BGLU 基因 家 族 ， 药 用 植物 
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Complete genome sequencing and BGLU gene family 


analysis of Angelica dahurica 


WANG Yalan, ZHOU Luojing, ZHANG Lingyu, ZHANG Jing, 
BIAN Jinhui, GAO Jihai" 
(Key Laboratory of Distinctive Chinese Medicine Resources in Southwest China, Chengdu 
University of Traditional Chinese Medicine, Chengdu 611137, China) 
Abstract: Angelica dahurica is a common kind of medicine and food homology, which is not only 
a common clinical traditional Chinese medicine, but also a spice, with a wide range of uses. In 
order to obtain the whole genome sequence information of A. dahurica, this study used A. 
dahurica var. formosana leaf DNA as material, and the Nanopore sequencing technology was used 
to establish its nucleotide sequences database, then genome assembly, function annotation and 
evolution analysis were carried out by bioinformatic methods. The results were as follows: (1) 662 
Gb the third-generation data were obtained after the original sequencing data, with the Read N50 
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about 32 932 bp. The assembled A. dahurica var. formosana genome size was 5.6 Gb, contig N50 
being about 806 638 bp. (2) 66.47% of the genes from the assembled sequence got gene 
annotation after being compared with functional databases such as NR, KOG and KEGG. The 
result of KOG gene annotation was that the protein function of A. dahurica var. formosana 
concentrated in the general functional prediction only, posttranslational modification, protein 
turnover, chaperones signal transduction mechanisms. GO functional classification indicated that 
the genes of A. dahurica var. formosana concentrated on cell biological processes and components. 
KEGG analysis found that the 4. dahurica var. formosana genes mostly involved in metabolic 
pathways. (3) 45 genes of BGLU family were identified in A. dahurica var. formosana. In this 
study, the whole genome of A. dahurica var. formosana is resolved by the third-generation 
sequencing technology for the first time, which lay a foundation for the systematic biological 
study of A. dahurica var. formosana , and is conducive to the further development and utilization. 
At the same time, the BGLU family genes were preliminarily analyzed, it also provides an 
important theoretical basis for the further study of the function of BGLU in the growth and 
development of A. dahurica var. formosana . 

Key words: Angelica dahurica var. formosana, genome, the third-generation sequencing 
technology, BGLU gene family, medicinal plant 


白芷 为 伞 形 科 (Apiaceae) 植物 白芷 (Angelica dahurica) ILATE (A. dahurica var. 
formosana) 的 干燥 根 ， 主 产 于 四 川 、 杭 州 等 地 ， 多 为 栽培 品 。 白 芷 是 常见 的 药 食 同 源 药 
材 ， 在 临床 上 可 用 于 感冒 头痛 、 丑 校 骨 痛 、 牙 痛 、 郊 疡 肿 辛 等 各 种 类 型 的 疼痛 症状 (国家 药 
员 会 ，2020)， 在 日 常生 活 中 也 可 以 作为 香料 使 用 。 同 时 ， 由 于 其 气味 芳香 ， 还 被 广泛 
应 用 于 化 妆 品 、 洗 护 用 品 等 方面 (于 静 等 ，2014)。 和 白芷 含有 多 种 活性 成 分 ， 如 香 豆 素 类 、 
挥发 油 类 、 多 糖 类 、 生 物 碱 类 等 (Li et al, 2014; Zhao et al., 2022)， 现 代 研 究 表明 其 主要 有 效 
成 分 是 香 豆 素 类 和 挥发 油 类 ， 具 有 人 解 热 镇 痛 、 抗 炎 、 抗 病原 微生物 、 抗 肿瘤 、 降 压 、 保 肝 
等 多 种 药理 作用 (吉庆 等 ，2020; EE, 2020). 

白芷 的 应 用 前 景 十 分 广泛 ， 但 近年 对 白芷 的 研究 多 数 集中 在 化 学 成 分 、 栽 培 技术 、 药 
理 药 效 的 解析 等 方面 ， 而 少 有 关于 白芷 遗传 信息 的 研究 ， 目 前 只 见 对 白芷 转录 组 进行 测序 
分 析 ( 吴 萍 等 ，2020) 的 研究 ， 对 白芷 COSNTANS-like( 蒋 翼 杰 等 ，2021D)、NAC( 黄 文 娟 等 ， 
2021)、MYB-related( 刀 菲 等 ，2022) 基 因 家 族 的 研究 以 及 白芷 中 香 豆 素 合 成 关键 基因 的 挖掘 
均 是 依据 转录 组 数据 进行 (刘洋 ，2019)， 白 芷 基因 组 数据 的 缺乏 导致 无 法 获取 白芷 完整 的 
遗传 信息 ， 更 多 的 研究 无 法 开展 或 进一步 深入 ， 故 对 其 进行 全 基因 组 测序 对 是 十 分 重要 
的 。 
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香 豆 素 类 成 分 既是 白芷 的 药 效 成 分 又 是 香气 成 分 ， 香 豆 素 类 化 合 物 广泛 存在 于 自然 界 
的 多 种 植物 中 ， 如 伞 形 科 、 芸 香 科 、 桑 科 等 的 植物 (Venugopala et al, 2013)， 近 年 来 对 香 豆 
素 的 生物 合成 途径 研究 较 多 ， 一 些 关 键 酶 及 功能 作用 的 解析 也 较为 清晰 ( 段 珍 等 ，2022)。 
Hepat ed55- 8 NT NP Cf-glucosidase, BGLU)，B- 葡 区 糖苷 酶 家 族 不 仅 在 香 豆 素 的 生物 
合成 中 起 到 重要 调控 作用 ， 而 且 广 泛 参 与 植物 激素 信号 激活 (Sun et al., 2014)、 次 生 代谢 
(Sampedro et al., 2017) 等 多 种 重要 生理 过 程 。 有 研究 表明 5- 葡 萄 糖苷 酶 家 族 在 草木 标的 香 豆 
素 合成 中 起 到 重要 调控 作用 ( 吴 凡 ，2021)， 在 玉米 中 能 通过 催化 碳水 化 合 物 部 分 和 香 豆 素 
核心 结构 间 的 5- 葡 萄 糖苷 键 的 水 解 ， 进 而 产生 香 豆 素 苷 元 形式 ; 黑 曲霉 来 源 的 /- 葡 萄 糖苷 
酶 对 丁 公 节 粗 提 物 中 的 东 葛 着 苷 可 特异 性 水 解 ， 并 使 其 含量 提高 47%( 于 坤 朋 等 ，2023); 
从 拟 南 芥 中 分 离 的 3 种 5- 葡萄 糖苷 酶 能 特异 性 水 解 东 葛 车 苷 。 东 葛 营 音 在 太 -葡萄 糖苷 酶 的 
作用 下 水 解 成 东 葛 营 内 酯 ， 东 芒 若 内 酯 属于 香 豆 素 类 成 分 ， 在 白芷 中 也 有 存在 ， 课 题 组 推 


测 在 白芷 的 香 豆 素 成 分 合成 中 ，BGZLC 基 因 也 起 到 关键 作用 。 

由 于 目前 未 见 关 于 白芷 高 质量 基因 组 的 研究 ， 对 白芷 中 香 豆 素 合 成 途径 的 解析 也 较 
少 ， 为 了 进一步 丰富 白芷 的 遗传 进化 的 研究 资料 ， 本 研究 通过 对 杭 白 芷 进行 第 二 Aus 三代 
基因 组 测序 ， 对 测序 数据 进行 组 装 、 注 释 等 ， 获 得 杭 和 白芷 的 高 质量 基因 组 ， 并 进行 功能 注 
尘 、 基 因 家 族 聚 类 等 分 析 ， 然 后 挖掘 香 豆 素 合成 途径 关键 基因 BCLU， 通 过 在 线 软件 对 基 
因 组 中 提取 的 BCZC7 序 列 进行 基本 的 特征 分 析 ， 拟 探讨 以 下 问题 : (GD) 杭 白芷 基因 组 概况 ; 
(2) 基 因 功 能 主要 集中 在 哪些 生物 学 过 程 及 代谢 通路 ，(3)3GLU 基因 家 族 的 基本 特征 是 什 
么 。 本 研究 将 为 白芷 的 后 续 研 究 提供 数据 基础 及 分 子 基 础 ， 能 为 后 续 深 入 研究 BGLU 基因 
家 族 在 白芷 香 豆 素 合 成 途径 中 的 功能 提供 前 期 基础 。 


1 材料 与 方法 


1.1 材料 及 DNA 提取 
杭 和 白芷 植株 来 自 成 都 中 医药 大 学 药 用 植物 园 ， 经 国家 中 药 种 质 资源 库 专 家 高 继 海 副 教 
授 鉴 定 为 伞 形 科 植 物 杭 白 芷 (Angelica dahurica var. formosana), KME W JEJA E 
害 的 叶片 ， 先 用 车 饮水 清洗 表面 ， 然 后 使 用 75% 乙 醇 清洗 3 次 ， 擦 干 后 置 于 -80 CURE, 
备用 。 
参照 沙 丽 萍 (2018) 采 用 CTAB 法 提取 杭 白 芷 叶片 DNA。 提 取 的 DNA. 需 通过 琼脂 糖 凝 
胶 电 泳 和 Qubit Fluorometer 检测 浓度 ， 以 及 Nanodrop 检测 纯度 和 完整 度 。 
1.2 文库 构建 及 测序 
(1) MGISEQ-200 测序 : 提取 的 杭 白 芷 基因 组 DNA. 经 检测 合格 以 后 ， 通 过 酶 解 随 机 
打 断 成 片段 ， 经 末端 修复 、 加 A 尾 、 加 测序 接头 、 纯 化 、PCR 扩 增 等 步骤 构建 插入 片段 长 
度 为 150 bp 的 DNA 文库 。 将 构建 好 的 文库 在 MGISEQ-200 平台 进行 双 端 测序 。 
(2) Nanopore 测序 : 利用 磁 珠 对 检测 合格 的 DNA 进行 富 集 和 纯化 ， 对 纯化 后 的 
DNA 进行 损伤 修复 、 末 端 修复 、 加 A 尾 后 再 纯化 ， 将 产物 进行 测序 相关 的 连接 及 纯化 ， 得 
到 最 终 上 机 文库 ， 用 Qubit 对 建 好 的 DNA 文库 进行 精确 的 定量 检测 ， 取 一 定量 的 DNA X 
库 混 合 上 机 相关 试剂 后 加 入 流动 槽 中 ， 在 GridION 测序 仪 上 进行 单 分 子 测序 ， 得 到 原始 数 
据 。 
1.3 基因 组 测序 数据 的 质量 控制 
二 代 原 始 测序 数据 中 包含 的 接头 信息 ， 低 质量 碱 基 ， 未 测 出 的 碱 基 〈 以 N 表示 ) 等 会 
C 对 后 续 的 信息 分 析 造 成 很 大 的 和 干扰， 这些 干扰 信息 需要 利用 FastQC v0.11.9 软件 和 
Trimmomatic v0.39 软件 进行 过 滤 ， 最 终 得 到 有 效 数据 (clean reads) 用 于 后 续 分 析 。 
对 于 三 代 Nanopore 测序 数据 使 用 NanoPlot v1.20.0 软件 对 测序 质量 进行 检测 ， 再 利用 
NanoFlit v2.8.0 软件 进行 低 质 量 和 短片 段 数据 的 过 滤 
1.4 基因 组 大 小 和 杂 合 度 评估 
利用 MGISEQ-200 测序 得 到 的 reads 数据 ， 采 用 Jellyfish v1.1.10 做 Survey 分 析 来 预 估 
基因 组 大 小 ， 杂 合 率 、 及 重复 序列 占 比 ， 以 判断 基因 组 复杂 情况 。 采 用 基因 K-mer 的 分 析 
方法 来 估计 杭 和 白芷 基因 组 特征 。 
1.5 基因 组 组 装 及 评估 
为 得 到 高 准确 性 的 三 代 组 装 结果 ， 先 采用 Canu v2.1.1(Koren et al., 2017) 软 件 对 Clean 
Data 进行 纠 错 ， 然 后 将 纠 错 后 的 数据 进行 组 装 ， 用 Racon v1.0.0(Senol et al., 2019) 软 件 对 组 
装 结果 进行 纠 错 ， 再 用 Pilon v1.22 软件 使 用 二 代数 据 进行 校正 ， 最 后 利用 BUSCO 
v5.1.2(Simáo et al., 2015) 软 件 对 组 装 完 成 的 基因 组 进行 完整 性 评估 。 
1.6 序列 预测 
首先 ， 基 于 结构 预测 和 从 头 预测 (42 initio) 的 原理 ， 使 用 LTR Finder v1.05(Xu et al., 
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2007). RepeatScout v1.0.6 ~ PILER-DF v2.4 软件 构建 重复 序列 数据 库 ， 利 用 
PASTEClassifier v2.0 对 构建 好 的 重复 序列 库 进 行 分 类 ; 然后 ， 基 于 重复 序列 数据 库 
Repbase(https:/www.girinst,org/repbase/) 合 并 作为 最 终 的 杭 白 芷 基因 组 的 重复 序列 数据 库 ; 
最 后 ， 基 于 构建 好 的 数据 库 采 用 RepeatMasker v4.1.2 软件 对 杭 和 白芷 进行 重复 序列 的 预测 。 
基于 从 头 预 测 和 同 源 物 种 预测 (Homolog) 两 种 原理 对 杭 白 芷 基因 组 进行 基因 预测 ， 并 对 
预测 结果 进行 评估 。 首 先 ， 利 用 Genscan v1.0、Augustus v3.3.1. GlimmerHMM v3.0.4. 
GeneID v1.4、SNAP v8.0.0 进行 从 头 预 测 ， 然 后 ， 使 用 GeMoMa v1.3.1 进行 基于 同 源 物 
的 预测 ， 最 后 ， 利 用 EvidenceModeler v1.1.0 整合 、 校 正 上 述 方法 得 到 的 预测 结果 。 针 对 
编码 RNA 预测 ， 包 括 了 microRNA, rRNA 及 tRNA 等 已 知 功能 的 RNA， 分 别 基 本 
Rfam(Finn et al., 2006) 数据 库 和 miRBase 数据 库 并 利用 Infenal v1.1.3 进行 rRNA. 和 
microRNA 预测 ， 利 用 tRNAscan-SE v2.0.7 识别 tRNA- 
1.7 功能 基因 注释 

对 预测 得 到 的 基因 序列 与 NR(Non-Redundant Protein Database)、KOG(EuKaryotic 
Orthologous Groups) 、KEGG(Kyoto Encyclopedia of Genes and Genomes), TrEMBL 等 功能 
数据 库 做 BLAST v2.2.31 比 对 ， 设 置 比 对 和 划 选 浆 值 (e-value<le-$)， 得 到 基因 功能 注释 。 基 
T NR 数据 库 比 对 结果 ， 应 用 软件 Blast2GO v5.2.5 进行 GO 数据 库 的 功能 注释 。 
1.8 基因 家 族 聚 类 分 析 及 系统 进化 分 析 

利用 杭 白 芷 和 其 同 科 物 种 的 对 比 来 寻找 基因 家 族 ， 首 先 从 NCBI 数 据 库 中 下 载 杭 白 芷 
E RE dE. 3] F 3€ (Apium graveolens(Song et al, 2021) 、 胡 99 þ (Daucus carota subsp. 
sativusylorizzo et al., 2016) B] 4& Á FF 7], JM CGDB(httpZ/cgdb.bio2db.com) F £X 75 X 
(Coriandrum sativum)(Song et al., 2020) Œ F1 7i] ; H OrthoMCL v2.0(Li et al., 2003) 软 件 对 
all-vs-all blastp 获得 的 所 有 物种 和 蛋白 序列 间 的 相似 性 关系 进行 聚 类 分 析 。 通 过 从 OrthoMCL 
聚 类 结果 中 提取 的 单 拷贝 蛋白 序列 ， 再 Muscle v3.8.31(Edgar, 2004) 软 件 中 进行 对 比 ， 再 通 
过 RAxML v8.2.12(Guindon & Gascuel，2003) 软 件 采 用 最 大 似 然 法 (ML TREE) 构 建 进 化 树 。 
1.9 杭 白 芷 BGLU 基因 家 族 成 员 挖 气 
利用 SMART 数据 库 ， 获 得 拟 南 芥 BGLU 基因 家 族 的 典型 结构 域 序列 tBLASTN 
(P=0.001)， 并 搜索 杭 白芷 基因 组 数据 库 ， 通 过 Pfam 数据 库 得 到 杭 白 芷 中 所 有 BGLU 基因 
家 族 成 员 。 
1.10 BGLU 家 族 基 因 理 化 性 质 、 亚 细胞 定位 、 蛋 白 二 级 结构 及 保守 域 分 析 

利用 ProtParam tool(https://web.expasy.org/protparam/)(Wilkins et al., 1999) 在 线 软件 对 
BGLU X Jk 和 蛋白 其 进行 S 化 性 质 分 析 ; 用 Plat- 
mPLoc(http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/) A WoLF 
PSORT(https://wolfpsort.hgc.jp/) 在 线 软件 综合 分 析 其 亚 细 胞 定位 ; 使 用 SOMPA(https:;//npsa- 
prabi.ibcp.fr/cgi-bin/npsa_automat.pl?page=npsa_sopma.html) 在 线 软件 分 析 其 二 级 结构 ， 通 过 
MEME(https://meme-suite.org/meme/tools/meme) 在 线 软 件 分 析 保 守 结 构 域 。 
1.11 BGLU 家 族 系 统 进化 分 析 

利用 MEGA 软件 中 的 Clustal W v2.0(Larkin et al., 2007) 程 序 对 杭 和 白芷 和 拟 南 芥 的 
BGLU 家 族 蛋 白 序 列 进行 对 比 ， 将 对 比 结果 采用 邻接 法 构建 系统 发 育 树 。 
2 结果 与 分 析 
2.1 基因 组 测序 

通过 测序 平台 对 杭 和 白芷 叶片 进行 全 基因 组 测序 ， 对 原始 数据 的 reads 质量 值 进行 初步 


过 滤 ， 去 掉 低 质量 和 短片 段 的 reads， 统 计 得 到 150 Gb 二 代 原 始 数据 ， 得 到 662 Gb 三 代 原 
始 数据 。 三 代数 据 中 ，Read N50 为 32 932 bp， 最 长 reads 的 长 度 为 422 833 bp, FHKE 
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为 27 750 bp， 测 序 质量 符合 后 续 组 装 要求 。Survey 分 析 得 出 杭 和 白芷 基因 组 的 大 小 约 为 5.2 


Gb。 
2.2 基因 组 组 装 及 评估 


638 bp， 最 长 的 Contig 为 21 677 961 


借助 Canu 软件 对 杭 白 芷 进行 纠 错 组 装 ， 基 因 组 大 小 约 为 5.6 Gb, Contig N50 为 806 


bp, GC 含量 为 35.73%。 组 装 后 的 基因 组 采用 BUSCO 


v5.1.2 软件 评估 ， 在 组 装 的 基因 中 共 找 到 1580 个 完整 的 BUSCO 基因 ， 其 中 完整 单 找 贝 的 
1 272 个 ，Fragmented BUSCO 18 个 基因 ， 有 16 个 基因 在 Embryophyta_odb10 数据 库 中 没 


2.3 基因 预测 结果 


找到 ，BUSCO 评估 基因 组 完整 度 为 97.9%， 表 明 该 组 装 结果 较为 完整 。 


利用 RepeatMasker v4.1.2 软件 3 


因 组 ， 占 比 91.36% 。 其 中 长 散在 重复 序列 (LINE) 数 目 为 21 726 条 ， 占 比 0.41%; 短 散 在 


行 重复 序列 预测 得 到 包含 5.4 Gb 重复 序列 的 杭 白 芷 基 


重复 序列 (SINE) 数 目 为 0 条 ; 长 末端 重复 序列 (LTR) 数 目 为 3 550 524 条 ， 占 比 69.07 %， 


copyia 数目 为 1083 004 条 ， 占 比 30 
circles 数目 为 2 893 条 ， 占 比 0.03%; 


.0196, gypsy 数目 为 989 985 条 ， 占 比 24.56%, Roling- 
简单 重复 序列 (SSR) 数 目 为 7710 条， 占 比 0.03%。 


在 获得 的 67 004 个 基因 中 ， 有 34 119 (93.1%) 个 基因 得 到 了 其 他 物种 同 源 性 鉴定 或 


RNA-seq 数据 的 支持 。 共 鉴定 出 2 
(rRNA). 781 个 转移 RNA (tRNA), 
(snRNA). 

2.4 基因 功能 注释 与 分 析 


的 总 基因 数 的 44.46%。 从 图 中 可 以 
生物 合成 ， 转 运 和 代谢 ， 占 比 为 10 
比 为 6.7%， 碳 水 化 合 物 转运 和 代谢 ， 


749 个 非 编码 RNA ncRNA)， 包 括 20 个 核糖 体 RNA 
97 个 小 分 子 RNA (microRNA) 和 15 505 个 小 核 RNA 


通过 KOG 功能 注释 (图 D) 可 得 出 ， 杭 白芷 基因 组 共 29 788 个 基因 获得 注释 ， 占 预测 到 


看 出 ， 杭 白芷 的 蛋白 功能 主要 集中 在 次 级 代谢 产物 的 
.8%， 其 次 为 信号 转 导 机 制 ， 占 比 为 10.1%， 转 录 ， 占 
占 比 为 3.7%; 一 般 功 能 预测 ， 占 比 为 22.8%。 这 些 基 


的 差异 性 表达 可 以 为 今后 杭 和 白芷 的 深入 研究 提供 数据 支持 。 
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功能 分 类 Function class 


A. RNA 加 工 和 修饰 ，B. 染色 质 结构 和 动力 学 ;C. 能 量 生产 和 转换 ，D. 细胞 周期 调控 ， 细 胞 分 裂 ， 染 色 
体 分 配 ; E. 氨基 酸 转 运 和 代谢 ;FF. 核 彰 酸 转运 和 代谢 ，G. 碳水 化 合 物 转运 和 代谢 ，H. 辅酶 转运 和 代谢 ; 
L 脂 质 转 运 和 代谢 ; J 翻译， 核糖 体 结构 和 生物 合成 ，K. 转录 ; L. 复制 ， 重 组 和 修复 ，M. 细胞 壁 /细胞 膜 
/ 胞 外 被 膜 生 物 合 成 ，N. 细胞 运动 ，O. 翻译 后 修饰 ， 蛋 白质 转换 ， 伴 侣 ;了 P. 无 机 离子 转运 和 代谢 ，Q. 次 
级 代谢 产物 的 生物 合成 ， 转 运 和 代谢 ，R. 一 般 功 能 预测 ，S. 功能 未 知 ; T. 信号 转 导 机 制 ，U. 胞 内 运输 ， 
分 泌 和 具 泡 运输 ; V. 防御 机 制 ，W. 胞 外 结构 ;YY. 细胞 核 结构 ; Z. 细胞 骨架 。 


A. RNA processing and modification; B. Chromatin structure and dynamics; C. Energy production and conversion; 


D. Cell cycle control, cell division, chromosome partitioning; E. Amino acid transport and metabolism; F. 
Nucleotide transport and metabolism; G. Carbohydrate transport and metabolism; H. Coenzyme transport and 
metabolism; I. Lipid transport and metabolism; J. Translation, ribosomal structure and biogenesis; K. 
Transcription; L. Replication, recombination and repair; M. Cell wall/membrane/envelope biogenesis; N. Cell 
motility; O. Posttranslational modification, protein turnover, chaperones; P. Inorganic ion transport and 
metabolism; Q. Secondary metabolites biosynthesis, transport and catabolism; R. General function prediction; S. 
Function unknown; T. Signal transduction mechanisms; U. Intracellular trafficking, secretion, and vesicular 
transport; V. Defense mechanisms; W. Extracellular structures; Y. Nuclear structure; Z. Cytoskeleton. 
图 1 KOG 功能 分 类 注释 图 
Fig.l KOG function annotation classification chart 


杭 白 芷 基因 组 GO 注释 (图 2) 表明， 共有 44 540 个 基因 具有 GO 注释 功能 ， 占 预测 到 的 
总 基因 数 的 66.47%。 功 能 主要 分 布 在 生殖 、 细 胞 过 程 、 胁 迫 应 答 、 细 胞 、 细 胞 部 位 等 的 基 
因 占 优势 ， 其 中 在 生殖 的 基因 占 比 最 多 。 
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1. 细胞 杀伤 ，2. 多 生物 过 程 ; 3. 多 细胞 生物 过 程 ，4. 信号 转 导 ; 5$. 免疫 系统 过 程 ，6. 定位 ; 7. 发 育 过 程 ; 

8. 细胞 组 分 或 生物 合成 ; 9. 生物 调控 ; 10. 单一 生物 过 程 ，11. 代谢 过 程 ，12. 胁迫 应 答 ，13. 细胞 过 程 ; 14. 
生殖 ;15. 细胞 膜 部 位 ，16. 膜 封 闭 腔 ; 17. 细胞 膜 ，18. 细胞 器 部 位 ，19. 高 分 子 复 合 物 ;，20. 细胞 器 ，21. 
细胞 ，22. 细胞 部 位 ，23. 分 子 传感器 活动 ， 24. 分 子 功 能 调节 器 ， 25. 转录 因子 活性 ， 和 蛋白 结合 ; 26. 转运 
活性 ，27. 信号 转 导 活性 ，28. 核酸 结合 转录 因子 活性 ，29. 催化 活性 ，30. 结合 。 

图 中 红色 框 代表 生物 学 过 程 ， 绿 色 框 代表 细胞 组 分 ， 蓝 色 框 代表 分 子 功能 。 


1. Cell killing; 2. Multi-organism process; 3. Multicellular organismal process; 4. Signaling; $. Immune system 


process; 6. Localization; 7. Developmental process; 8. Cellular component organization or biogenesis; 9. 
Biological regulation; 10. Single-organism process; 11. Metabolic process; 12. Response to stimulus; 13. Cellular 
process; 14. Reproduction; 15. Membrane part; 16. Membrane-enclosed lumen; 17. Membrane; 18. Organelle part; 
19. Macromolecular complex; 20. Organelle; 21. Cell; 22. Cell part; 23. Molecular transducer activity; 24. 
Molecular function regulator; 25. Transcription factor activity, protein binding; 26. Transporter activity; 27. Signal 
transducer activity; 28. Nucleic acid binding transcription factor activity; 29. Catalytic activity; 30. Binding. 

The red represents the biological process, the green represents the cellular components, and the blue represents the 


molecular function in this figure. 


图 2 GO 注释 分 类 图 


Fig.2 GO annotation classification chart 


KEGG 通路 注释 (图 3) 对 杭 和 白芷 的 15 263 个 基因 进行 了 通路 注释 ， 占 预测 到 的 总 基因 
数 的 22.78%。 其 注释 结果 表明 参与 “代谢 ”的 基因 占 主要 ， 其 中 微生物 在 不 同 环境 中 的 代 
谢 、 碳 代谢 、 氨 基 酸 生物 合成 为 主要 代谢 通路 。 


遗传 信息 处 理 。 环境 信息 处 理 


Genetic Environmental 细胞 过 程 ” 视 体 系统 
代谢 information information Cellular É il 
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功能 分 类 Function class 


1. 微生物 在 不 同 环境 中 的 代谢 ，2. 碳 代谢 ，3. 氨基 酸 的 生物 合成 ;4. 茶 丙 素 的 生物 合成 ;5. RH; 6. 
淀粉 和 蔗糖 代谢 ，7. 糖 酵 解 / 糖 异 生 ，8. 氧化 磷酸 化 ，9. 喀 喧 代谢，10. 戊 糖 、 葡 萄 糖 醛 酸 转换 ，11. 氨基 
糖 和 核 童 酸 糖 代 谢 ，12. 甘油 磷脂 代谢 ，13. 色 氨 酸 代谢 ，14. 内 质 网 中 的 蛋白 质 加 工 ，1S. 剪接 体 ，16. 核 
糖 体 ，17. 核 质 运输 ，18. 泛 素 介 导 的 蛋白 水 解 ， 19. mRNA 监测 通路 ，20. RNA 降解 ， 21. MAPK 信号 通 
路 ，22. 植物 激素 信号 转 导 ; 23. NF-kappa B 信号 通路 ，24. PI3K-Akt 信号 通路 ，25. 胞 吞 ，26. 细胞 周期 ; 


nil 
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27. 卵 母 细胞 减 数 分 裂 ，28. 生成 信号 通路 ，29. NOD 样 受 体 信 和 号 通路 ; 30. 植物 -病原 互 作 ; 31. Toll 样 受 体 
信号 通路 ，32. Toll 和 Imd 信号 通路 ，33. 生 热 作用 ; 34. 胰岛 素 信号 通路 。 


1. Microbial metabolism in diverse environments; 2. Carbon metabolism; 3. Biosynthesis of amino acids; 4. 


Phenylpropanoid biosynthesis; $. Purine metabolism; 6. Starch and sucrose metabolism; 7. Glycolysis / 
Gluconeogenesis; 8. Oxidative phosphorylation; 9. Pyrimidine metabolism; 10. Pentose and glucuronate 
interconversions; 11. Amino sugar and nucleotide sugar metabolism; 12. Glycerophospholipid metabolism; 13. 
Tryptophan metabolism; 14. Protein processing in endoplasmic reticulum; 15. Spliceosome; 16. Ribosome; 17. 
Nucleocytoplasmic transport; 18. Ubiquitin mediated proteolysis; 19. mRNA surveillance pathway; 20. RNA 
degradation; 21. MAPK signaling pathway; 22. Plant hormone signal transduction; 23. NF-kappa B signaling 
pathway; 24. PI3K-Akt signaling pathway; 25. Endocytosis; 26. Cell cycle; 27. Oocyte meiosis; 28. Neurotrophin 
signaling pathway; 29. NOD-like receptor signaling pathway; 30. Plant-pathogen interaction; 31. Toll-like receptor 
signaling pathway; 32. Toll and Imd signaling pathway; 33. Thermogenesis; 34. Insulin signaling pathway. 
图 3 KEGG 功能 注释 图 
Fig.3 KEGG function annotation diagram 


2.5 基因 家 族 聚 类 分 析 及 系统 进化 分 析 

将 杭 白 芷 与 同 科 植物 元 昔 、 开 荣 、 胡 葛 小 的 蛋白 序列 进行 对 比 ， 在 杭 和 白芷 基因 组 的 67 
004 个 蛋白 序列 中 共 鉴 定 出 23 151 个 基因 家 族 ， 其 中 4 004 个 基因 家 族 包含 18 151 个 基因 
特异 存在 于 杭 和 白芷 中 ，4 种 植物 所 共有 的 基因 家 族 有 1 030 个 〈 图 4)。 
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44 个 基因 家 族 Venn 图 
Fig.4 Venn diagram of gene families of 4 species 
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为 进一步 研究 杭 白 芷 的 种 属 关系 ， 以 96 条 单 拷贝 蛋白 序列 进行 比较 分 析 ， 选 择 拟 南 芥 
(Arabidopsis thaliana), K?K(Zea mays)、 无 油 樟 (4mpborella ticpnopoda) 以 及 同 为 伞 形 科 的 区 


SE. Jp. E RB. (Angelica sizensis) 共 7 个 已 知 基 因 组 信息 的 物种 ， 与 杭 和 白芷 构建 


遗传 进化 树 《〈 图 5)。 结 果 表 明 杭 白芷 与 苑 划 聚 为 一 文 ， 两 物种 间 杀 缘 关 系 较 近 。 


0.162 242 


0.370 019 


016242 0.209 495 


无 油 樟 Amborella trichopoda 
玉米 Zea mays 


TUB JF Arabidopsis thaliana 


0.056387 7 -0033 8334 HA% b Daucus carota 
0.167 473 — 926183. 芹菜 Apium graveolens 
LLL 99168595 当归 Angelica sinensis 
0.037 529 7 
0.000 001 934 17 E% Coriandrum sativum 
0.058 0469 

9232922. 白芷 Angelica dahurica 

图 5 物种 间 进 化 关系 

5 物种 间 进 化 关系 


Fig.5 Evolutionary relationships between species 


2.6 WAÉ BGLU 家 族 基 因 理 化 性 质 、 亚 细胞 定位 分 析 


在 杭 和 白芷 全 基因 组 中 共 鉴 定 到 45 个 BGLU 家 族 基 因 ， 分 别 命名 为 
AdBGLUO1-AdBGLUAS , Ñ) Hj] Protparam Tool 进行 理化 性 质 分 析 ，Plant-mPLoc 及 WoLF 
PSORT 进行 亚 细 胞 定位 《〈 表 1)。 结 果 表 明 ， 杭 白芷 的 45 个 BGLU 基因 编码 的 氨基 酸 数 目 
在 51-930 之 间 ， 最 长 包含 930 个 氨基 酸 残 基 (AdBGLU32), REUE 51 个 氨基 酸 残 基 


CAdBGLU30); 不 稳定 指数 在 11.18-61.86 之 间 ， 其 中 38 个 的 不 稳定 系数 小 于 40, HEMI 
为 稳定 蛋白 ， 其 余 7 个 为 不 稳定 蛋白 ; 脂肪 系数 为 56.76~113.25， 说 明和 蛋白 的 热 稳定 性 车 
好 ; 亲 水 系数 在 -0.643~0.35 之 间 ， 其 中 7 个 为 正 值 ，38 个 为 负 值 ， 说 明 主 要 为 杀 水 性 如 
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白 ; 等 电 点 在 4.24~10.35 之 间 ， 说 明和 氨基 酸 大 多 为 弱酸 或 弱 碱 性 ， 亚 细胞 定 
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AdBGLU 家 族 成 员 分 别 定位 于 细胞 核 、 细 胞 质 、 叶 绿 体 、 液 泡 中 。A4BGLU 基因 家 族 的 不 
同 成 员 间 理化 性 质 差异 较 大 ， 且 亚 细 胞 定位 较 多 ， 推 测 该 基因 家 族 成 员 功 能 较为 多 样 ， 在 


生物 体内 参与 不 同 的 生理 过 程 。 


X 1 杭 白 下 BGLU 家 族 和 蛋白 理化 性 质 、 亚 细胞 定位 


4 


Tablel Physicochemical properties and subcellular localization of AABGLU 


编号 基因 ID 氨基 酸 ”相对 分 子 FEA 原子 总 ”不 稳定 指 ”脂肪 系 FHR WAE 
Number Gene ID 数目 质量 Theoretical — 数 数 BUKTE ”位 
Number Molecular pl Total Instability Aliphatic Grand Subcellular 
of weight number index index average location 
amino of of 
acids atoms hydropa 
-thicity 
AdBGLUOI 2evm.model.cont 86 9 761.19 10.35 1 388 40.46 91.74 -0.277 细胞 核 
ig 30308 npl2.2 Nucleus 
AdBGLUO2 >evm.model.cont 57 6 466.10 4.62 889 15.95 82.11 -0.261 细胞 质 


ig 30308 npl2.3 


Cytoplasm 


202308.00239v1 


ChinaXiv 


ChinaXiv 合 作 期 刊 


AdBGLUO3 


AdBGLUOA4 


AdBGLUOS 


AdBGLUOG 


AdBGLUOT 
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AdBGLUII 
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AdBGLUITS8 
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AdBGLU20 


AdBGLU21 


AdBGLU22 


AdBGLU23 


AdBGLU24 


AdBGLU25 


AdBGLU26 


7evm.model.cont 
ig 28255 np12.3 


7evm.model.cont 
ig 52431 np122 


7evm.model.cont 
ig 52794 np12.2 


7evm.model.cont 
ig 4149 np12.12 


7evm.model.cont 
ig 3487 npl2.4 


7evm.model.cont 
ig 2826 npl12.18 


7evm.model.cont 
ig 6813 np12.9 


7evm.model.cont 
ig 15195 np12.3 


7evm.model.cont 
ig 5102 np12.18 


7evm.model.cont 
ig 41190 npl2.1 


7evm.model.cont 
ig 51569 npl2.1 


7evm.model.scaff 
old 848 np12.18 


7evm.model.cont 
ig 13620 npl2.1 


7evm.model.cont 
ig 875 np12.20 


7evm.model.cont 
ig 5591 np12.41 


7evm.model.cont 
ig 5591 np12.42 


7evm.model.cont 
ig 7151 npl2.13 


7evm.model.cont 
ig 4524 npl2.5 


7evm.model.cont 
ig 6554 np12.21 


7evm.model.cont 
ig 8631 npl2.4 


7evm.model.cont 
ig 8631 npl2.5 


7evm.model.cont 
ig 26865 npl2.1 


7evm.model.cont 
ig 8414 npl2.6 


7evm.model.cont 
ig 9063 np12.8 
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52 735.38 


58 661.26 


14 503.44 
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3] 082.92 


6.02 


844 
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528 


4.52 


4.62 


6.44 
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7.09 
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1 661 
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37.66 
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38.25 


22.53 


36.57 


19.51 


18.04 


35.78 


28.72 


44.65 


30.18 


34.39 


35.45 


23.91 


26.02 


26.27 


18.43 


23:91 


28.05 


32.37 


11.18 


34.54 


80.66 


96.25 


77.93 


79.86 


80.66 


69.98 


77.10 


99.26 


85.69 


80.11 


81.41 


89.72 


111.27 


94.32 


78.9 


99.87 


73.89 


81.94 


99.23 


72.98 


82.82 


68.64 


80.28 


91.28 


-0.291 


0.054 


-0.276 


-0.381 


-0.293 


-0.506 


-0.310 


-0.019 


-0.074 


-0.419 


-0.39 


-0.019 


0.35 


-0.22 


-0.156 


-0.085 


-0.346 


-0.324 


-0.448 


-0.364 


-0.237 


-0.495 


-0.342 


0.025 


叶绿体 
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叶绿体 
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液 泡 
vacuole 
液 泡 
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叶绿体 
Chloroplast 


细胞 核 
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液 泡 
vacuole 


细胞 质 
Cytoplasm 


细胞 质 
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叶绿体 
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vacuole 


细胞 质 
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细胞 质 
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细胞 质 
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细胞 质 
Cytoplasm 


细胞 质 
Cytoplasm 


细胞 核 


Nucleus 


细胞 质 
Cytoplasm 


细胞 质 
Cytoplasm 
液 泡 
vacuole 
叶绿体 
Chloroplast 
液 泡 
Vacuole 


细胞 核 


Nucleus 


AdBGLU27 2evm.model.cont 638 73 116.7 7.08 10241 3227 83.71 -0.289 叶绿体 


ig_16310_np12.1 Chloroplast 

7 
AdBGLU28 >eym.model.cont 511 58 131.95 8.07 8 096 29.65 80.94 -0.264 液 泡 

ig 5761 np12.10 vacuole 
AdBGLU29 2evm.modelcont 74 8 391.65 7.00 1 140 52.63 56.76 -0.043 细胞 质 

ig 4290 npl2.7 Cytoplasm 
AdBGLU30 »evm.modelcont 51 5 765.41 4.24 800 18.36 93.53 -0.271 叶绿体 

ig 9965 np12.1 Chloroplast 
AdBGLUS31 »evm.model.cont 396 44 314.95 5.76 6 198 30.14 78.81 -0.391 叶绿体 

ig 5955 np12.1 Chloroplast 
AdBGLU32 »evm.model.cont 930 106 242.47 6.17 14 772 | 3627 74.69 -0.486 细胞 质 

ig 62681 np12.3 Cytoplasm 
AdBGLU33 2evm.modelcont 121 13 148.77 4.78 1] 827 38.14 80.5 0.043 细胞 质 

ig 3403 np12.17 Cytoplasm 
AdBGLU34 »evm.model.cont 507 58 332.13 6.81 8 127 37.22 81.79 -0.371 叶绿体 

ig_15768_np12.1 Chloroplast 

1 
AdBGLU35 >evm.model.cont 77 8 591.58 4.64 1 178 11.55 83.64 -0.196 细胞 质 

ig 9908 npl2.3 Cytoplasm 
AdBGLU36 »evm.model.cont 295 33 829.6 6.75 4 802 26.76 113.25 0.259 细胞 质 

ig 20919 np12.2 Cytoplasm 
AdBGLU37 >evm.model.cont 321 36 622.81 6.75 5 194 25.13 110.44 0.214 叶绿体 

ig 20919 np12.4 Chloroplast 
AdBGLUS38 »evm.modelcont 510 59 022.16 8.89 8 224 2241 73.59 -0.456 细胞 质 

ig 3686 np12.4 Cytoplasm 
AdBGLU39 »evm.model.cont 303 33 883.74 921 4 740 37.2 79.4] -0.257 细胞 质 

ig 4890 np12.4 Cytoplasm 
AdBGLUAO 2evm.modelcont 228 25 724.04 6.42 3 638 29.16 106.75 0.226 叶绿体 

ig 10929 np12.6 Chloroplast 
AdBGLU41 >evm.model.cont 85 9 541.12 9.74 1 368 43.04 111.18 -0.048 细胞 质 

ig 40130_np12.2 Cytoplasm 
AdBGLUA2 »evm.modelcont 177 20 452.06 5.85 2831 51.96 78.14 -0.401 叶绿体 

ig 9053 np12.1 Chloroplast 
AdBGLUA3 »evm.modelcont 78 8 918.13 5 1 242 26.56 93.85 -0.228 叶绿体 

ig 4791 np12.1 Chloroplast 
AdBGLUAA 2evm.modelcont 511 58 990.4 9.18 8 224 22:79 71.02 -0.442 叶绿体 

ig 5084 np12.19 Chloroplast 
AdBGLUAS »evm.model.scaff | 269 31 269.15 9.95 4 431 61.86 78.25 -0.643 细胞 核 

old 6091 np12.6 Nucleus 


2.7 杭 白芷 BGLU 基因 家 族 和 蛋白 二 级 结构 及 保守 域 分 析 
在 线 分 析 网 站 对 杭 白 芷 BGLU 家 族 蛋白 的 二 级 结构 分 析 表 明 C 2)，BGLU 家 族 中 a- 
螺旋 和 无 规则 卷曲 所 占 比 例 最 大 ， 其 中 a- 螺 旋 所 占 比例 最 大 的 有 27 个 ， 无 规则 卷曲 所 占 比 
例 最 大 的 有 18 个 。 无 规则 卷曲 为 蛋白 中 的 不 稳定 编码 区 ， 因 此 可 推测 无 规则 卷曲 越 多 ， 该 
家 族 成 员 的 功能 越 多 样 ( 姚 菲 等 ，2022)。 
X 2 杭 白 芷 BGLU 家 族 和 蛋白 二 级 结构 分 析 
Table 2 Analysis of secondary structure of AdBGLU family proteins 


编号 基因 ID o- 螺 旋 ”有 -转角 “延伸 链 无 规则 
Number Gene ID Alpha Beta Extended — 3$ 


jd 


helix turn strand Random 


coil 

AdBGLUOI 2-evm.model.contig 30308 np12.2 . 30.23 5.81 20.93 43.02 
AdBGLUO2 2-evm.model.contig 30308 npl2.3 28.07 3.51 33.33 35.09 
AdBGLUO3 2evm.model.contig 28255 npl2.3 | 41.34 5.62 12.64 40.41 
AdBGLUOA 2evm.model.contig 52431 npl2.2 . 42.47 4.63 19.31 33.59 
AdBGLUOS 2evm.model.contig 52794 npl2.2 39.06 6.05 16.99 37.89 
AdBGLUOG »evm.model.contig 4149 npl2.12 36.99 6.5 16.87 39.63 
AdBGLUOT 2evm.model.contig 3487 npl2.4 40.09 4.84 12.95 42.12 
AdBGLUOS 2evm.model.contig 2826 npl2.18 . 35.70 7.72 18.16 38.41 
AdBGLUOO »2evm.model.contig 6813 npl12.9 39.36 6.97 16.20 37.48 
AdBGLUT0 2evm.model.contig 15195 np12.3 53.7 9.26 14.81 22.22 
AdBGLUII 2evm.model.contig 5102 npl2.18 . 41.38 6.90 24.14 27.59 
AdBGLUI2 »evm.model.contig 41190 np12.1 37.26 7.58 17.26 37.89 
AdBGLUI3 »2evm.model.contig 51569 np12.1 41.77 6.83 13.65 37.75 
AdBGLUIA 2evm.model.scaffold 848 np12.18 39.92 5.14 18.58 36.36 
AdBGLUITS »evm.model.contig 13620 np12.1 46.56 6.35 13.76 33.33 
AdBGLUIT6 »evm.model.contig 875 np12.20 39.35 6.45 16.13 38.06 
AdBGLUMT »2evm.model.contig 5591 npl2.41 45.21 4.11 6.85 43.84 
AdBGLUITS 2-evm.model.contig 5591 npl2.42 . 42.5 11.25 18.75 24 

AdBGLUIT9 »-evm.model.contig 7151 npl2.13 38.85 8.92 17.2 35.03 
AdBGLU20 2evm.model.contig 4524 npl2.5 54.84 3.23 12.9 29.03 
AdBGLU21 »evm.model.contig 6554 npl2.21 51.92 15.38 11.54 21.15 
AdBGLU22 »2evm.model.contig 8631 npl2.4 36.15 6.55 18.18 39.11 
AdBGLU23 2evm.model.contig 8631 npl2.5 38.42 7.53 15.06 39.00 
AdBGLU24 2evm.model.contig 26865 npl12.] | 22.73 10.61 15.91 50.76 
AdBGLU25 »evm.model.contig 8414 npl2.6 35.51 7.48 22.43 34.58 
AdBGLU26 2evm.model.contig 9063 np12.8 28.83 8.9 25.27 37.01 
AdBGLU271 2evm.model.contig 16310 npl2.17 41.07 4.55 13.64 40.75 
AdBGLU28 2evm.model.contig 5761 npl2.10 40.12 5.87 17.22 36.79 
AdBGLU29 »2evm.model.contig 4290 npl2.7 17.57 12.16 25.68 44.59 
AdBGLUS30 2evm.model.contig 9965 npl2.1 45.10 9.80 15.69 29.41 
AdBGLU31 2evm.model.contig 5955 npl2.1 34.09 7.32 15.91 42.68 
AdBGLU32 »2evm.model.contig 62681 npl12.3 3624 8.28 18.71 36.77 
AdBGLU33 2evm.model.contig 3403 npl2.17 17.36 9.92 34.71 38.02 
AdBGLU34 »-evm.model.contig 15768 npl2.11 37.67 8.09 17.16 37.08 
AdBGLUS35 2evm.model.contig 9908 np12.3 42.86 5.19 24.68 27.27 
AdBGLU36 >evm.model.contig 20919 np12.2 43.39 5.76 18.98 31.86 
AdBGLU37 >eym.model.contig_20919_np12.4 41.43 5.61 20.25 32.71 
AdBGLU38 >eym.model.contig_3686_np12.4 37.65 6.67 17.06 38.63 
AdBGLU39 >evm.model.contig 4890 npl2.4 41.91 7.59 11.55 38.94 
AdBGLUAO 2evm.model.contig 10929 npl2.6 ^ 49.56 4.82 21.05 24.56 
AdBGLU41 >eym.model.contig_40130_np12.2 21.18 5.88 23.53 49.41 
AdBGLUA2 »2evm.model.contig 9053 npl2.1 38.42 3.95 11.3 46.33 
AdBGLUA3 »2evm.model.contig 4791 npl2.1 41.03 7.69 21.79 29.49 
AdBGLUAA 2evm.model.contig 5084 npl2.19 ^ 38.55 7.44 17.81 36.20 
AdBGLUAS 2evm.model.scaffold 6091 np12.6 40.52 2.60 11.15 45.72 


保守 域 分 析 结 果 表 明 〈 图 6) Motif 8 为 最 短 ， 含 有 29 NAERA; Motif 6 稍 长 ， 
含 35 个 氨基 酸 残 基 ; Motif 2、Motif 3 和 Motif 7 较 长 ， 含 有 41 个 氨基 酸 残 基 ; Motif 1. 
Motif 4. Motif 5 最 长 ， 均 含有 50 个 氨基 酸 残 基 。 通 过 保守 基 序 结构 可 看 出 Motif 5 的 保守 
性 较 高 。 通 过 保守 域 分 析 发 现 ， 不 同 基因 含有 的 保守 域 数 量 不 同 ， 在 所 有 基 序 中 ，Motif 1 
出 现 的 频率 最 高 ， 推 测 其 为 特征 基 序 。 
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Motif 图 中 字母 越 高 ， 表 明 该 氨基 酸 H 


上 现 的 频率 越 大 ， 则 序列 较为 保守 。 


The higher the letter in the Motif diagram, the more frequently the amino acid appears, and the more conserved the 


sequence. 


图 6AdBGLU 家 族 和 蛋白 的 保守 基 序 分 析 
Fig.6 Conserved motif analysis of AdBGLU family proteins 


亚 家 族 (A~F), AdBGLU 和 AtBGLU 基因 


基于 杭 白 芷 和 拟 南 芥 的 蛋白 序列 构建 系统 发 育 树 〈 图 7)，44BGZLU 基因 被 分 为 6 个 
同时 存在 于 B~F 亚 族 中 ， 表 明 这 些 亚 族 中 基因 功 


能 保守 ( 张 曼 等 ，2022)。A 亚 族 中 ， 有 3 个 41BGLU， 无 44BGLU; B 亚 族 有 1 个 44BGLU 
和 4 个 AtBGLU; C 亚 族 有 13 个 AdBGLU 和 14 个 AtBGLU; D 亚 族 有 5 个 44BGLU 和 8 个 


AtBGLU; E | 


LIRA 14 ^ AdBGLU Ñ 17 A AtBGLU; FF 


严 族 有 12 个 AdBGLU 和 2 个 


AtBGLU. Æ C 3 


PA TERUEL A TE rj ET Ré ACER A KS EH] OR 


可 能 存在 调控 杭 


严 族 中 ， 杭 白芷 和 拟 南 芥 


的 基因 数量 相似 ， 推 测 此 


FF 族 中 的 同 源 基因 在 拟 


Uff. 2020); 而 在 其 余 亚 族 中 ， 数 量 差 异 较 大 ， 
白芷 内 香 豆 素 合成 的 关键 基因 ， 此 结论 还 需 进 一 步 验证 。 
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图 7 杭 和 白芷 和 拟 南 芥 BGLU 基因 家 族 进 化 分 析 
Fig.7 Phylogenetic analysis of BGLU proteins in Angelica dahurica and Arabidopsis thaliana 


3 讨论 与 结论 


有 研究 表明 物种 的 基因 组 大 小 与 其 倍 性 水 平 及 相应 的 染色 体 数目 存在 一 定 的 正 相关 性 
(Mank & Avise, 2006)， 通 过 对 禾 本 科 282 种 植物 基因 参数 的 研究 发 现 ， 随 着 染色 体 倍 性 从 
二 倍 体 到 八 倍 体 之 间 增 加 ， 其 对 应 的 基因 组 大 小 也 显著 增 大 ， 其 基因 组 大 小 与 倍 性 、 染 色 
体 数 呈 极 显著 正 相 关 ( 李 桂 双 等 ，2012)。 本 研究 获得 约 为 5.6 Gb 的 杭 白 芷 基因 组 ， 其 他 已 
完成 基因 组 测序 的 伞 形 科 植 物 有 积 雪 草 〈 约 为 430 Mb), F 〈 约 为 3.33 Gb)、 当 归 A 
为 2.37Gb) (Han et al., 2022)、 水 芹 〈 约 为 1.28 Gb)、 北 柴 胡 ( 约 为 621.42 Mb )、 胡 葛 小 
( 约 为 421.5 Mb), EHZ h (AX 371.6 Mb), Æ (2973 2130.29 Mb)， 其 中 ， 白 芷 、 
上 芹菜、 当归 、 芜 萎 的 染色 体 数目 为 2n=22 条 ， 积 雪 草 和 胡 葛 卜 、 野 胡 葛 下 的 染色 体 数目 为 
2n-18 条 ， 北 上 某 胡 的 染色 体 数目 为 2n=12 条 ， 除 北 柴 胡 外 ， 符 合 染 色 体 数目 与 基因 组 大 小 
呈正 相关 关系 ， 表 明 本 次 测 得 的 杭 和 白芷 基因 组 大 小 符合 染色 体 数目 。 和 白芷、 芹菜 的 植株 生 
长 可 达 1.5 m， 而 其 余 植 物 均 不 超过 1 m， 初 步 推测 伞 形 科 植 物 基因 组 大 小 与 植株 高 度 呈 正 
相关 关系 ( 邵 晨 等 ，2021)， 可 为 后 续 同 属 或 同 科 植 物 基 因 组 的 研究 提供 参考 。 


香 豆 素 类 化 合 物 是 一 


素 、 吡 喃 香 豆 素 和 其 他 香 豆 素 四 类 (EREE, 2022) 


径 进行 合成 ， 目 前 已 有 较 多 下 


(ZHANG et al., 2021); X} E HZ ÁJ% 
香 豆 酸 ， 用 同样 方法 对 白花 前 胡 和 紫花 前 胡 的 C4 末 基因 功能 ; 
催化 功能 (WANG et al., 2020); 
形成 东 葛 车 内 醋 具 有 关键 作用 (WU et al., 2022); 
基因 对 于 叶 喃 香 豆 素 的 形成 可 能 起 到 关键 决定 
中 属于 较为 上 游 的 基因 ， 对 于 上 出 
少 ， 尤 其 在 白芷 中 更 为 缺乏 。 看 
理 过 程 中 的 多 个 方面 有 关 ， 尤 其 是 对 生物 和 非 生物 胁迫 的 响应 。 如 陆 


类 具有 重要 药 用 价值 的 天 然 化 合 物 ， 分 为 简单 香 豆 素 、 呐 喃 香 豆 


FE 


在 白花 草木 标的 下 


或 能 正 向 调控 棉花 黄蓉 病 抗 性 


EE IKA, 
究 所 获得 的 杭 白 芷 基因 组 ， 能 为 后 


AtBGLU21-23 调控 根 中 东 
A 


供 基 础 


目前 ， 


Hati 


在 细胞 质 、 叶 绿 体 、 液 泡 


， 上 有 具有 重要 价值 及 意义 。 
已 在 拟 南 芥 中 发 现 48 个 BGLU 家 族 基 因 
al., 2011)， 水 稳 中 发 现 40 个 (Opassiri et al., 2006), 大豆 
AU 53 个 ( 张 曼 等 ， 


究 表 明 BGLU 通 


EHE 


1， 香 豆 素 通过 葵 丙 烷 代 谢 途 


已 
已 


究 揭示 参与 该 生物 合成 途径 的 关键 基因 。 例 如 ， 从 明亮 发 光 
杆菌 中 提取 的 PAL 基因 能 将 工 - 葵 丙 氨 酸 转化 为 肉桂 酸 、 将 工 酷 氨 酸 转化 为 对 香 豆 酸 
究 中 发 现 ， 有 3 个 C48 基因 具有 众 化 肉桂 酸 生成 对 
行 探索 ， 发 现 都 具有 相同 的 
究 中 也 发 现 MaBGLUI ÆA T ZR GEHE 


在 白芷 同属 
ER]. PAL. C4H 55h 
类 基因 的 研究 较 多 ， 但 是 相对 下 游 的 
过 激活 植物 激素 和 防御 化 合 物 ， 与 植物 生 


植物 当归 的 研究 中 ， 发 现 P7 


拟 南 芥 中 的 AtBGLUIO 可 以 催化 游离 ABA 的 产生 ， 
41BGLU42 参与 诱导 机 体 对 纪 
续 进 行 白 芷 中 香 豆 素 类 成 分 合成 相关 基因 的 挖掘 提 


E 香 豆 素 生 物 合成 途径 


BGLU 基因 的 研究 较 


也 棉 中 5 个 GhBGLU 


胞 疾病 的 抵抗 力 。 


， 玉 米 中 发 现 26 个 (G6mez-Anduro et 


发现 42 AARSE, 2019), Ri 


2022), Eid AX 51 个 (Yang et al., 2021)， 本 研究 在 杭 和 白芷 中 鉴 
定 出 45 个 BGLU 家 族 基 因 ， 并 对 其 进行 理化 性 质 、 二 级 结构 等 分 析 ， 发 现 其 亚 细 胞 定位 多 


， 这 一 结论 与 玉米 中 的 p- 葡 4 


et al., 2000), AdBGLU 3& [X] Z Jj HIE 


生物 体内 参与 多 
前 胡 素 、 
基因 功能 的 多 样 


4 数据 获得 


原始 测序 数据 已 上 传 至 国家 基因 库 生命 大 数据 


明 该 基因 家 族 的 结构 较为 复杂 ， 


化 性 质 、 二 级 结构 、 了 
测 其 功能 较为 多 样 ， 各 基因 在 功能 分 工 上 


不 同 代 谢 过 程 。 杭 息 芷 中 存在 多 


Z 


可 糖苷 酶 定位 基本 一 致 Kristoffersen 
胞 定位 等 特征 差异 较 大 ， 说 


JX. AdBGLU 的 初步 分 析 对 杭 
进一步 揭示 和 利用 杭 和 白芷 香 豆 素 类 成 分 合成 途径 关键 基因 


项 目 编号 为 CNP0003549. 


参考 文献 : 


所 不 同 ， 在 


香 豆 素 类 化 合 物 ， 如 欧 前 胡 素 、 腊 欧 
白 当 归 素 、 佛 手 柑 内 酯 等 等 ， 其 生物 合成 途径 也 较为 复杂 ， 这 可 能 是 与 AdBGLU 
白芷 香 豆 素 生 物 合成 具有 重要 作用 ， 可 为 
的 功能 提供 前 期 基础 。 


EF 台 CCNGBdb, https://db.cngb.org/); 


DUAN Z, WU F, YAN Q, et al., 2022. Research progress on plant coumarin biosynthesis pathway 
and the genes encoding the key enzymes[J]. Acta Pratacult Sin, 31(1): 217-228.[ 段 珍 ， 吴 凡 ， 


Ej. 58, 2022. 植物 香 豆 素 生 物 合成 途径 及 关键 酶 基因 和 


217-228.] 


究 进展 [四 . 草 ， 


学 报 ，31(]): 


EDGAR RC, 2004. MUSCLE: multiple sequence alignment with high accuracy and high 
throughput[J]. Nucl Acids Res, 32(5): 1792-1797. 
FINN RD, MISTRY J, SCHUSTER-BOÓCKLER B, et al., 2006. Pfam: clans, web tools and 
services[J]. Nucl Acid Res, 34(Database issue): D247-D251. 
GÓMEZ-ANDURO G, CENICEROS-OJEDA EA, CASADOS-VÁZQUEZ LE, et al., 2011. 
Genome-wide analysis of the beta-glucosidase gene family in maize (Zea mays L. var B73)[J]. 
Plant Mol Biol, 77(1-2): 159-183. 


GUINDON $, GASCUEL O, 2003. A simple, fast, and accurate algorithm to estimate large 
phylogenies by maximum likelihood[J]. Syst Biol, 52(5): 696-704. 

HAN X, LI C, SUN S, et al., 2022. The chromosome-level genome of female ginseng (Angelica 
sinensis) provides insights into molecular mechanisms and evolution of coumarin 
biosynthesis[J]. Plant J, 112(5): 1224-1237. 

HUANG WJ, XU X, CHEN JS, et al., 2021. Bioinformatics analysis and expression pattern of 
NAC transcription factor family of Angelica dahurica var. formosana from Sichuan province[J]. 
Chin J Chin Mat Med, 46(7): 1769-1782. [ 黄 文 娟 ， 许 奢 ， 陈 新 松 ， 等 ，2021. 川 白 芷 NAC 
家 族 的 生物 信息 及 表达 模式 分 析 [ 刀 . 中 国 中 药 杂 志 ，46(7): 1769-1782.] 

IORIZZO M, ELLISON S, SENALIK D, et al., 2016. A high-quality carrot genome assembly 
provides new insights into carotenoid accumulation and asterid genome evolution[J]. Nat Genet, 
48(6): 657-666. 

JI Q, MA YH, ZHANG Y, 2020. Research progress on chemical constituents and pharmacological 
effects of Angelicae dahuricae radix[J]. Food Drug, 22(6): 509-514. [8 JX,. BE, IKKE, 
2020. 白芷 的 化 学 成 分 及 药理 作用 研究 进展 加 . 食品 与 药品 ，22(6): 509-514.] 

JIANG YJ, JIANG YM, YAO F, et al., 2021. Bioinformatics analysis on the CONSTANS-like 
protein family in Angelica dahurica var. formosana[J]. Mol Plant Breed, 19(12): 3923-3931. 
[ 薪 辟 杰 ， 江 美 彦 ， 姚 菲 ， 等 ，2021. 川 白芷 CONSTANS-like $ ÉL OE IM 4) PT]. 
分 子 植物 育种 ，19(12): 3923-3931.] 

KE DX, LIU YH, ZHANG JJ, et al., 2019. Genome-wide identification and expression analysis 
of BGLU family genes in Soybean[J]. J Xinyang Norm Univ(Nat Sci Ed), 32(3): 372-378. [fu 
PER, XUAXOUE, KR, 5, 2019. 大 豆 BGLU AED 20A 4 d ALB 3E 5i 3 2) PT]. 信 

阳 师 范 学 院 学 报 (自然 科学 版 )，32(3): 372-378.] 

KOREN S, WALENZ BP, BERLIN K, et al., 2017. Canu: scalable and accurate long-read 
assembly via adaptive k-mer weighting and repeat separation|J]. Genome Res, 27(5): 722-736. 
KRISTOFFERSEN P, BRZOBOHATY B, HÓHFELD L et al., 2000. Developmental regulation 
of the maize Zm-p60.1 gene encoding a beta-glucosidase located to plastids[J]. Planta, 210(3): 

407-415. 

LARKIN MA, BLACKSHIELDS G, BROWN NP, et al., 2007. Clustal W and Clustal X version 
2.0[J]. Bioinformatics, 23(21): 2947-2948. 

LI B, ZHANG X, WANG J, et al., 2014. Simultaneous characterisation of fifty coumarins from 


the roots of Angelica dahurica by off-line two-dimensional high-performance liquid 


M— 


chromatography coupled with electrospray ionisation tandem mass spectrometry[J]. Phytochem 
Analysis, 25(3): 229-240. 

LI GS, CAO B, BAI CK, 2012. Correlation analysis between genome size and seed 
characteristics in poaceae plants[J]. Bull Bot Res, 32(6): 701-706. [ 李 桂 双 ， 曹 博 ， 白 成 科 ， 
2012. 禾 本 科 植 物 基因 组 大 小 与 种 子 特性 的 相关 性 分 析 [J. 植物 研究 ，32(6): 701-706.] 

LI L, STOECKERT CJ Jr, ROOS DS, 2003. OrthoMCL: identification of ortholog groups for 
eukaryotic genomes[J]. Genome Res, 13(9): 2178-2189. 

LIU YX, 2020. Identification and expression analysis of WRKY gene family in Solanum 


lycopersicum[|D]. Shenyang: Shenyang Agricultural University: 1-79. [X W 4f , 2020. 番茄 
WRKY 基因 家 族 成 员 鉴 定 及 表达 分 析 [D]. 沈阳 : 沈阳 农业 大 学 : 1-79.] 


LIU Y, 2019. Studies on bacteriostatic mechanism of Angelica dahurica and excavationof key 


E 


genes of coumarin biosynthesis[D]. Chengdu: Sichuan Agricultural University: 1-69. [刘洋 


2019. 川 白 芷 抑 菌 机 理 研 究 及 香 豆 素 生 物 合成 关键 基因 的 挖掘 [D]. 成 都 : 四川 农业 大 学 : 
1-69.] 

MANK JE, AVISE JC, 2006. Cladogenetic correlates of genomic expansions in the recent 
evolution of actinopterygiian fishes[J]. Proceed Royal Soc B Biol Sci, 273(1582):33-38. 

NATIONAL PHARMACOPOEIA COMMISSION, 2020. Pharmacopoeia of People's Republic of 
China: 1[M]. Beijing: China Medical Science Press: 109-110. [国家 药典 委员 会 ，2020. 中 华 
人 民 共 和 国药 典 : 一 部 [M]. 北京 : 中 国医 药 科 技 出 版 社 : 109-110.] 

OPASSIRI R, POMTHONG B, ONKOKSOONG T, et al., 2006. Analysis of rice glycosyl 
hydrolase family 1 and expression of Os4bglu12 beta-glucosidase[J]. BMC Plant Biol, 6: 33. 

SAMPEDRO J, VALDIVIA ER, FRAGA P, et al., 2017. Soluble and membrane-bound p- 
glucosidases are involved in trimming the xyloglucan backbone[J]. Plant Physiol, 173(2): 1017- 
1030. 

SENOL CALI D, KIM JS, GHOSE S, et al., 2019. Nanopore sequencing technology and tools 
for genome assembly: computational analysis of the current state, bottlenecks and future 
directions[J]. Brief Bioinform, 20(4): 1542-1559. 

SHA LP, 2018. Examples of CTAB method, SDS method and salting-out method for crude 
extraction of plant DNA[J]. Teach Middle Sch Biol, 21: 65-67. [7b Wi ŻE, 2018. 例 谈 植物 
DNA 粗 提取 的 CTAB ik. SDS 1E zbWriA[] 中 学 生物 教学 ，21: 65-67.] 

SHAO C, LI YQ, LUO A, et al., 2021. Relationship between functional traits and genome size 
variation of angiosperms with different life forms[J]. Biodivers Sci, 29(5): 575-585. [ 邵 晨 ， 李 
R, FKR, SR, 2021. PRERE CT 83 ZI BE VEA 55 3E AL ZR AUI NRI OS A UIT. 生物 多 样 
性 ，29(5): 575-585] 

SIMAO FA, WATERHOUSE RM, IOANNIDIS P, et al., 2015. BUSCO: assessing genome 
assembly and annotation completeness with single-copy orthologs[J]. Bioinformatics, 31(19): 
3210-3212. 

SONG X, WANG J, LI N, et al., 2020. Deciphering the high-quality genome sequence of 
coriander that causes controversial feelings[J]. Plant Biotechnol J, 18(6): 1444-1456. 

SONG X, SUN P, YUAN J, et al., 2021. The celery genome sequence reveals sequential paleo- 
polyploidizations, karyotype evolution and resistance gene reduction in apiales[J]. Plant 
Biotechnol J, 19(4): 731-744. 

SUN HH, XUE YM, LIN YF, 2014. Enhanced catalytic efficiency in quercetin-A'-glucoside 
hydrolysis of 7hermotoga maritima p-glucosidase A by site-directed mutagenesis[J]. J Agric 
Food Chem, 62(28): 6763-6770. 

VENUGOPALA KN, RASHMI V, ODHAV B, 2013. Review on natural coumarin lead 
compounds for their pharmacological activity[J]. Biomed Res Int, 2013: 963248. 

WANG R, LIU J, YANG DY, et al., 2020. Research progress in chemical constituents and 
pharmacological action of Angelica dahurica[J]. Inf Trad Chin Med, 37(2): 123-128. [-E 2, XI 

军 ， 杨 大 宇 ， 等 ，2020. 白芷 化 学 成 分 与 药理 作用 研究 进展 加. 中 医药 信息 ，37(2): 123- 
128.] 

WANG RX, SONG J, SUN B, et al,. 2022. Research progress of function and biosynthesis of 
coumarins[J]. Chin Biotechnol, 42(12): 79-90. [ER F, RIE, fM, 55, 2022. 香 豆 素 类 
化 合 物 功能 及 生物 合成 研究 进展 [四 . 中 国生 物 工程 杂志 ，42(12): 79-90.] 

WANG Z, JIAN X, ZHAO Y, et al.,2020. Functional characterization of cinnamate 4-hydroxylase 
from Helianthus annuus Linn using a fusion protein method[J]. Gene, 758: 144950. 


WILKINS MR, GASTEIGER E, BAIROCH A, et al., 1999. Protein identification and analysis 
tools in the ExPASy server[J]. Meth Mol B, 112: 531-552. 

WU F, DUAN Z, XU P et al., 2022. Genome and systems biology of Melilotus albus provides 
insights into coumarins biosynthesis[J]. Plant Biotechnol J, 20(3): 592-609. 

WU F, 2021. Study on whole genome sequencing and functional genes of key traits in 
Cleistogenes songorica and Melilotus albus[D]. Lanzhou: Lanzhou University: 1-185. [ 吴 几 ， 
2021. TET CRI EA 4E EC WE 4: 3 DS] 2H. CELO EERDE HEEL [D]. 兰州 : 兰州 
大 学 : 1-185.] 

WU P, GUO JX, WANG XY, et al., 2020. High-throughput transcriptome sequencing of roots of 
Angelica dahurica and data analyses[J]. Mol Plant Breed, 2020, 18(10): 3207-3216.[& PE, F5 
RE, ERF, %, 2020. 2E T mE EC BO BUG EA IE (Angelica dahurica) 根 转录 组 数 
Jer vr]. 分 子 植物 育种 ，18(10): 3207-3216.] 

XU Z, WANG H, 2007. LTR_FINDER: an efficient tool for the prediction of full-length LTR 
retrotransposons[J]. Nucl Acid Res, 35(Web Server issue): W265-W268. 

YANG J, MA L, JIANG W, et al., 2021. Comprehensive identification and characterization of 
abiotic stress and hormone responsive glycosyl hydrolase family 1 genes in Medicago 
truncatula[J]. Plant Physiol Biochem, 158: 21-33. 

YAO F, JIANG MY, YANG YS, et al., 2022. Bioinformatics and expression analysis on MYB- 
related family in Angelicae dahuricae var. formosana[J]. Chin J Chin Mat Med, 47(7): 1831- 
1846. [Wt3E, ŽA, Aai 59, 2022. 川 白芷 MYB-related 家 族 的 生物 信息 及 表达 模 
ROMPI 中 国 中 药 杂 志 ，47(7): 1831-1846.] 

YU KP, PENG C, LIN YL, et al., 2023. Expression of B-glucosidase An-bgl3 from Aspergillus 
niger for conversion of scopoline[J]. Chin J Biotechnol, 39(3): 1232-1246. [.T-HRHH, SZ fg, 林 
燕 玲 等 , 2023. 黑 曲霉 B- 葡 萄 糖苷 酶 An-bgl3 BE SE ZELAGAUR ZR BUE B BRE]. 生物 工程 学 
报 ，39(3): 1232-1246.] 

YU J, ZHU YH, 2014. Summary of the application of Angelica dahurica in ancient 
prescription[J]. Heilongjiang Med J, 27(1): 156-158. [于 静 ， 朱 艳 华 ，2014. 中 药 白芷 在 古方 
中 美白 作用 的 应 用 概述 [中 . 黑龙 江 医药 ，27(1): 156-158.] 

ZHANG F, REN J, ZHAN J 2021. Identification and characterization of an efficient 
phenylalanine ammonia-lyase from Photorhabdus luminescens[|J]. Appl Biochem Biotechnol, 
193(4): 1099-1115. 

ZHANG M, WANG ZC, LIU ZW, et al., 2022-09-17. Genome-wide identification and analysis 
of BGLU genes family in Gossypium hirsutum|J/OL]. J Agric Sci Technol: 1-12. [SK &, E iE 
城 ， 刘 正文 ， 等 ，2022-09-17. 陆地 棉 BGLU 基因 家 族 成 员 的 全 基因 组 鉴定 与 表达 分 析 
[/OL]. 中 国 农业 科技 导报 : 1-12.] 

ZHAO H, FENG YL, WANG M, et al., 2022. The Angelica dahurica: a review of traditional uses, 
phytochemistry and pharmacology[J]. Front Pharmacol, 13: 896637. 


